期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 结合局部敏感哈希的 k近邻数据填补算法
郑奇斌, 刁兴春, 曹建军, 周星, 许永平
计算机应用    2016, 36 (2): 397-401.   DOI: 10.11772/j.issn.1001-9081.2016.02.0397
摘要555)      PDF (814KB)(969)    收藏
k近邻( kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高。为提高算法效率,提出结合局部敏感哈希(LSH)的 kNN数据填补算法LSH- kNN。首先,对不存在缺失的完整记录进行局部敏感哈希,为之后查找近似最近邻提供索引;其次,针对枚举型、数值型以及混合型缺失数据分别提出对应的局部敏感哈希方法,对每一条待填补的不完整记录进行局部敏感哈希,按得到的哈希值找到与其疑似相似的候选记录;最后在候选记录中通过逐个计算相似度来找到其中相似程度最高的 k条记录,并按照 kNN算法对不完整记录进行填补。通过在4个真实数据集上的实验表明,结合局部敏感哈希的 kNN填补算法LSH- kNN相对经典的 kNN算法能够显著提高填补效率,并且保持准确性基本不变。
参考文献 | 相关文章 | 多维度评价